首页> 外文OA文献 >Combine vector quantization and support vector machine for imbalanced datasets
【2h】

Combine vector quantization and support vector machine for imbalanced datasets

机译:结合矢量量化和支持矢量机处理不平衡数据集

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In cases of extremely imbalanced dataset with high dimensions, standard machine learning techniques tend to be overwhelmed by the large classes. This paper rebalances skewed datasets by compressing the majority class. This approach combines Vector Quantization and Support Vector Machine and constructs a new approach, VQ-SVM, to rebalance datasets without significant information loss. Some issues, e.g. distortion and support vectors, have been discussed to address the trade-off between the information loss and undersampling. Experiments compare VQ-SVM and standard SVM on some imbalanced datasets with varied imbalance ratios, and results show that the performance of VQ-SVM is superior to SVM, especially in case of extremely imbalanced large datasets.
机译:在具有高度维度的极不平衡的数据集的情况下,标准的机器学习技术往往会被大类淹没。本文通过压缩多数类来重新平衡偏斜的数据集。这种方法结合了向量量化和支持向量机,并构建了一种新方法VQ-SVM,可以重新平衡数据集而不会造成重大信息丢失。一些问题,例如为了解决信息丢失和欠采样之间的折衷,已经讨论了失真和支持向量。实验在具有不同失衡比的不平衡数据集上比较了VQ-SVM和标准SVM,结果表明,VQ-SVM的性能优于SVM,特别是在极不平衡的大型数据集的情况下。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号